세밀한 도구 호출

Claude에서 도구 사용과 스트리밍을 결합하면, AI가 도구 인수를 생성하는 동안 실시간 업데이트를 받을 수 있습니다. 이를 통해 더 반응성 높은 사용자 경험을 만들 수 있지만, 내부적으로 어떻게 동작하는지 이해해야 할 중요한 세부 사항이 있습니다.

기본 도구 스트리밍

스트리밍이 활성화된 상태에서 Claude는 요청을 처리하는 동안 다양한 유형의 이벤트를 반환합니다. 일반 텍스트 생성을 위한 ContentBlockDelta 이벤트는 이미 익숙하실 것입니다. 도구 사용의 경우, InputJsonEvent라는 새로운 이벤트 유형도 처리해야 합니다.

각 InputJsonEvent에는 두 가지 핵심 속성이 포함되어 있습니다:

partial_json - 도구 인수의 일부를 나타내는 JSON 청크
snapshot - 지금까지 수신된 모든 청크로 구성된 누적 JSON

스트리밍 파이프라인에서 이러한 이벤트를 처리하는 방법은 다음과 같습니다:

for chunk in stream:
    if chunk.type == "input_json":
        # Process the partial JSON chunk
        print(chunk.partial_json)
        # Or use the complete snapshot so far
        current_args = chunk.snapshot

JSON 유효성 검사 동작 방식

여기서 흥미로운 점이 있습니다. Anthropic API는 Claude가 생성하는 모든 청크를 즉시 전송하지 않습니다. 대신, 청크를 버퍼링하고 먼저 유효성을 검사합니다.

API는 무언가를 전송하기 전에 완전한 최상위 키-값 쌍이 완성될 때까지 기다립니다. 예를 들어, 도구가 다음 구조를 기대하는 경우:

{
  "abstract": "This paper presents a novel...",
  "meta": {
    "word_count": 847,
    "review": "This paper introduces QuanNet..."
  }
}

API는 다음과 같이 동작합니다:

abstract 값 전체가 완성될 때까지 대기
해당 키-값 쌍을 스키마에 대해 유효성 검사
abstract에 대해 버퍼링된 모든 청크를 한꺼번에 전송
meta 객체에 대해 동일한 과정 반복

이 유효성 검사 과정이 스트리밍이 활성화되어 있어도 지연 후 텍스트가 한꺼번에 쏟아지는 이유를 설명합니다. 청크는 완전하고 유효한 최상위 키-값 쌍이 준비될 때까지 보류됩니다.